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摘要 : 茶树 富 含 儿 茶 素 、 茶 氨 酸 和 咖啡 碱 等 多 种 具有 广泛 保健 功能 的 植物 代谢 产物 ， 为 探究 茶树 中 
茶 多 酚 等 产物 代谢 途径 的 相关 基因 ， 本 研究 以 贵州 都 匀 地 区 福 易 大 白 种 茶树 的 根 、 茎 、 叶 为 研究 对 
象 , 利用 高 通 量 测序 技术 构建 茶 的 转录 组 数据 库 并 往 选 其 根 、 茎 、 叶 差异 表达 基因 。 共 获 得 70.88 Gb 
Clean Data， 各 样品 Clean Data 均 达 到 6.33 Gb, Q30 碱 基 百分比 在 93.22% 以 上 。 将 Clean Reads 与 
中 国 种 茶树 参考 基因 组 进行 序列 比 对 ， 比 对 效率 从 87.83% 到 91.14%。 基 于 比 对 结果 ， 进 行 可 变 剪 
接 预测 分 析 和 基因 结构 优化 分 析 , 发 掘 新 基因 13 531 个 , 其 中 10 244 个 得 到 功能 注释 。 利用 FPKM 
进行 基因 表达 量 分 析 , 根据 基因 在 不 同样 品 中 表达 量 识 别 差异 表达 基因 。 叶 与 苓 的 差异 基因 有 5 595 
个 ， 其 中 2 769 个 在 茎 中 上 调 ，2 826 下 调 ， 叶 和 根 有 9 650 个 差异 基因 ，5 056 个 上 调 ，4 594 个 下 
调 ， 茎 和 根 中 有 5644 个 差异 基因 ，2 938 个 上 调 ，2 706 个 下 调 ， 并 通过 GO 和 KEGG 分 析 ， 将 差 
异 基 因 进行 功 能 注释 和 富 集 分 析 。 研 究 结果 为 揭示 都 义 地 区 福 易 大 白 种 茶 参 与 类 黄酮 、 茶 所 酸 和 咖 
啡 碱 等 代谢 途径 相关 的 基因 提供 参考 ， 为 选 育 优良 品种 等 提供 理论 依据 。 

关键 词 : 都 匀 地 区 ， 福 易 大 白 种 ， 根 茎 叶 ， 高 通 量 测序 ， 差 异 基因 
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Abstract: Tea tree is rich in catechins, theanine, caffeine and other metobolite of health fuction. In order 
to study the related genes of the metabolisms of the polyphenols. We use high-throughput sequencing 
technology to study the root, stem and leaf of Fudingdabai tea and find differential expression genes. The 
results showed that 70.88 Gb Clean Data was obtained, 6.33 Gb Clean Data is in each sample and Q30 is 
more than 93.22%. We map the Clean Reads to reference genome, the blast result is from 87.83% to 
91.14%. Then, alternative splicing and gene structure optimization was analyzed. There are 13 531 new 
genes, in which, 10 244 genes were annotated. GO and KEGG functional annotation and enrichment 
analysis were carried out in differential expression genes, which were identified according to gene 
expression level in different samples. There were 5 595 DEGs between leaf and stem, 2 769 genes were 
up-regulated and 2 826 genes were down-regulated. 9 650 DEGs were found beween leaf and root, 5 056 
genes were up-regulated and 4 594 genes were down-regulated. 5 644 genes between stem and root, 2 938 
genes were up-regulated and 2 706 genes were down-regulated. The results are expected to provide 
reference for recognizing genes of catechins, theanine, caffeine pathways, provide the theoretical basis for 
breeding improved seeds. 
Key words: Duyun, Fudingdabai, root-stem-leaf, high-throughput sequencing, differential expression 
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宜 茶 树 生 长 ， 资 源 丰 富 《 陈 世 军 等 ，2017) 。 不 同 品种 的 适 制 性 、 抗 逆 性 和 生长 势 不 同 ， 将 导致 茶 
品质 和 产量 的 不 同 。90 年 代 以 来 ， 都 匀 市 等 地 开始 大 量 引种 单产 高 、 品 质 好 、 适 应 性 强 的 福 易 大 
白 种 茶树 ， 增 加 了 茶树 的 遗传 多 样 性 。 目 前 ， 关 于 都 勾 地 区 的 茶 种 质 资源 保护 和 抗 性 研究 薄弱 〈 张 
丽 娟 等 ，2016) ， 特 别 是 在 转录 组 层面 上 的 研究 较 少 ， 在 一 定 程 度 上 限制 了 茶 产 业 的 应 用 发 展 。 而 
福 易 大 白 种 茶园 占 全 市 茶园 面积 85% 以 上 ， 因 此 ， 开展 都 色 地 区 福 鼎 大 白 种 根 、 茎 、 叶 的 转录 组 研 
究 对 茶树 在 品质 、 质 量 及 抗 首相 关 的 遗传 改良 上 具有 重要 意义 。 
随 着 高 通 量 测序 技术 的 出 现 ， 由 于 该 技术 能 快速 全 面 获 取 研 究 对 象 在 某 一 状态 下 基因 转录 信 
息 ， 因 此 该 技术 广泛 应 用 于 生物 体 转录 组 基因 表达 分 析 ， 能 够 准确 发 气 重 要 功能 基因 。Shi et al. 
(2011) 用 RNA-seq 技术 对 龙井 43 的 同时、 成熟 叶 、 茎 、 幼 根 、 花 蕾 以 及 成 熟 种 子 进行 测序 ， 总 
获得 127 094 个 基因 ， 其 中 包括 与 茶 特 有 香气 相关 的 代谢 产物 如 咖啡 碱 、 茶 氨 酸 、 黄 酮 等 合成 相 
关 的 基因 。 王 君 雅 等 《2019) 利用 转录 组 技术 对 龙井 43 和 中 茶 126 进行 差异 基因 表达 分 析 ， 结 果 
表明 99 个 表达 模式 完全 相反 的 基因 参与 的 生物 过 程 主要 有 MAPK 信和 号 通路 、 谷 胱 甘 肽 和 茶 丙 烷 等 。 
利用 转录 组 测序 技术 可 识别 编码 次 生 代 谢 的 调节 基因 和 结构 基因 ， 也 可 用 来 预测 未 知 基因 的 功能 ， 
是 进行 基因 组 功能 研究 的 重要 工具 (Novaes et al., 2008) 。 本 研究 利用 高 通 量 测序 技术 ， 对 都 匀 地 
区 福 易 大 白 种 茶树 根 、 茎 、 叶 中 类 黄酮 相关 代谢 途径 进行 研究 ， 探 索 根 、 茎 、 叶 中 差异 表达 基因 参 
与 的 代谢 途径 , 为 探讨 都 勾 地 区 福 易 大 白 种 茶树 生长 发 育 及 组 织 间 功能 差异 的 分 子 机 制 提供 理论 依 
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| 材料 与 方法 


1.1 材料 
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F 的 两 组 


根 3。 采 样 时 在 茶树 上 和 剪 取 发 
速冻 后 放 入 -80 'C 冰 箱 储存 备用 。 
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1.2 转录 组 测序 
将 采集 的 福 易 大 白 种 茶 苗 根 茎 


Illumina 高 通 量 测 序 ， 对 测 


FAIN ABJA A 
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叶 样 品 


心 管 作为 第 1 组 生物 学 重复 的 村 
个 生物 学 重复 ， 叶 的 第 1 个 生物 学 重复 。 每 个 村 


植 的 茶树 - 福 易 大 白 种 。 


放 在 干冰 上 


序数 据 进 行 质量 控 


茶 苗 选用 黔 南 民族 师范 学 院 茶 园 的 托 
。 选 取 9 株 培养 条 件 相同 长 势 相 同 的 茶 苗 分 为 3 组 ， 每 组 3 株 ,在 第 1 组 中 取 嫩 根 、 嫩 茎 和 嫩 
本 ， 分 别 标 为 根 的 第 1 个 生物 学 习 
本 3 个 生物 学 重复 ， 剩 余 的 两 组 生物 学 重复 分 别 在 
取样 ， 共 9 个 样本 ,分 别 为 叶 1、 叶 2、 叶 3、 茎 1、 茎 2、 茎 3、 根 1、 根 2 和 
育 阶 段 相似 、 部 位 相同 、 充 分 伸展 的 叶片 、 茎 和 根 ， 样 品 随后 迅速 放 


RE, mI 


送 往 北 京 百 迈 客 生物 科技 有 限 公司 进行 二 代 
关 ， 并 将 二 代 得 到 的 转录 本 与 已 测序 的 中 国 种 茶树 基 


因 组 通过 序列 比 对 的 方法 进行 比较 。 然 后 进行 转录 组 文库 质量 评估 、SNP/InDel 分 析 、 可 变 剪 接 事 
异 基因 分 析 和 差异 外 显 子 分 析 等 。 
Ilumina 二 代 测 序数 据 提交 至 NCBI 的 SRA 数据 库 ，BioProject 的 编号 为 PRINA562747。 


件 预 测 、 差 


2 结果 与 分 析 


2.1 测序 数据 质量 分 析 


量 值 达到 Q30 


合 分 析 要 求 。 


从 茶 苗 上 分 别 取 福 易 大 白 的 叶 、 茎 和 根 作 为 实验 材料 进行 转录 组 测序 ， 碱 基质 
的 占 93.22% 以 上 ，GC 含量 为 44.56%~45.85% C 1) ， 结 果 表 明 转 录 组 文库 质量 符 
表 1 样品 数据 产 出 统计 表 
Tablel Output statistics among samples 

样品 名 称 高 质量 Reads 数 数据 量 GC 含量 准确 率 >0.999 
Samples ID Clean reads Clean bases GC content Q30 (96) 
HF 1 Leaf 1 21 828 512 6 502 479 526 45.3696 93.6296 
HF 2 Leaf 2 28 450 839 8 467 453 936 45.2146 94.22% 
HF 3 Leaf 3 29 057 531 8 663 984 698 45.18% 93.80% 
Æ 1 Stem 1 21 212 767 6 326 706 172 44.711% 93.70% 
Æ 2 Stem 2 25 760 743 7 695 169 918 45.35% 93.65% 
ZE 3 Stem 3 26 080 601 7 745 810 876 44.56% 93.79% 
根 1 Root 1 23 789 995 7 078 295 558 45.85% 93.22% 
根 2 Root 2 29 354 206 8 728 835 412 45.61% 93.48% 
根 3 Root 3 32 496 205 9 667 694 674 45.7296 93.54% 


2.2 转录 组 与 中 国 种 茶树 基因 组 比 对 
2.2.1 比 对 效率 


本 研究 
行 比 对 ， 利 


利用 HISAT2 (Kim et al., 2015) 对 测序 数据 与 中 国 种 茶树 
用 StringTie (Pertea et al., 2015) 对 比 对 上 的 reads 进行 组 装 和 定量 ， 比 对 到 参考 基因 组 
上 的 Reads 占 Clean Reads 的 百分比 从 87.83-91.14% 
表 2 转录 组 与 基因 组 比 对 


Table 2 Transcriptome blast to genome 


表 2)。 


ZET 


FE 因 组 (Wei et al., 2018) 3f 
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样品 Clean Reads 比 对 到 参考 比 对 到 参考 
Samples 数 基因 组 上 的 EE [K] ZH HE 
Total Reads Reads 数 及 在 。” 位 置 的 Reads 
Clean Reads 数目 及 在 
中 占 的 百 分 Clean Reads 
比 中 占 的 百 分 


比 对 到 参考 基因 组 


多 处 的 Reads 数 及 在 


Cleans Reads 中 


百分比 


比 对 到 参考 


的 


Multiple Map Reads 


基因 组 正 链 
的 Reads 数 及 
在 Clean 
Reads 中 占 的 
百分比 


比 对 到 参考 
基因 组 负 链 
的 Reads 数 及 
在 Clean 
Reads 中 占 的 
百分比 


Mapped 比 Reads Map to Reads Map to 
Reads Uniq Mapped id et 
Reads 
HT 1 Leaf 1 43 657 024 39 632 673 37 386 481 2 246 192 19 481 885 19 587 096 
(90.7890) (85.6490) (5.1596) (44.6296) (44.8796) 
Hr 2Leaf2 . 56901 678 51 861 422 48 949 427 2911995 25 493 617 25 604 077 
(90.0990) (86.0296) (5.1296) (44.8096) (45.0096) 
HF 3 Leaf 3 58 115 062 52 353 177 49 39] 581 2 961 596 (5.1096) 25 733 339 25 849 934 
(90.0990) (84.9990) (44.2896) (44.4896) 
ZR 1Steml 42425534 38 353 796 36 275 113 2 078 683 (4.9096) 18 802 471 18 912 508 
(90.4090) (85.5096) (44.3296) (44.5896) 
ZR 2Stem2 X 51521 486 46 959 156 44 300 646 2 658 510 (5.16%) 22 986 304 23 138 767 
(91.1496) (85.9896) (44.6190) (44.9196) 
zE3Stem3 — 52161202 46917 710 44 231 706 2 686 004 (5.1596) 22 960 018 23 121 829 
(89.9590) (84.8096) (44.0296) (44.3396) 
$R 1 Root1 47579 990 41 789 100 38 194 971 3 594 129 (7.5596) 19 697 394 20 253 048 
(87.8396) (80.2896) (41.4096) (42.5796) 
根 2Root2 58708 412 52 846 174 49 318 371 3 5277 803 (6.0196) 25 605 318 25 872 980 
(90.0196) (84.0196) (43.6196) (44.0796) 
IR 3 Root3 64992 410 58 353 149 54 585 798 3 767 351 (5.8096) 28 312 409 28598 694 
(89.7896) (83.9990) (43.5696) (44.0096) 


2.2.2 SNP/InDel 分 析 
利用 GATK (Mckenna et al., 2010) 软件 对 Hisat2 比 对 结果 中 的 SNP 位 点 和 InDel 进行 识别 ， 


进而 分 析 基 因 表 达 水 平和 基 
Z-T HAS SNP GE3). nDe 主要 存在 于 


因 功 能 ，SNP 分 析 表 明基 因 区 SNP 位 点 数 多 于 基因 


内 含 子 区 和 基因 


K 3 SNP 位 点 统计 表 
Table 3 SNP loci statistics 


El 


间 区 (图 D. 


区 ， 转 换 型 SNP 


SNP 数 ke 基因 间 区 
样品 目 SNP 位 点 SNp 位 点 数 转交 型 SNP 其 次 弄 SNP AAA SNP 
Sample SNP 数 Intergenic Transition Traneyersion Heterozygosity(%) 
Genic SNP(%) SNP(%) 
Number SNP 
SNP 
HF 1 Leaf 1 540 707 428 327 112 380 66.07% 33.93% 51.38% 
HF 2 Leaf 2 541 852 413 786 128 066 66.25% 33.75% 34.86% 
HF 3 Leaf 3 583 002 448 343 134 659 66.33% 33.67% 45.95% 
Æ 1 Stem 1 489 642 393 947 95 695 65.4696 34.5496 49.6396 
Æ 2 Stem 2 504 670 394 472 110 198 65.89% 34.11% 35.85% 
Æ 3 Stem 3 638 706 496 194 142 512 65.90% 34.10% 50.79% 
TR 1 Root 1 521 166 409 410 111 756 65.7496 34.2696 50.9196 
根 2 Root 2 523 515 396 706 126 809 66.22% 33.78% 34.70% 
{R 3 Root 3 582 747 447 260 135 487 66.1496 33.8696 48.5896 
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1. 基因 间 ; 2. 基因 内 ; 3. 内 含 子 ; 4. EX: 5. F3 6. 受 体 剪 切 位 点 ; 7. 供 体 剪 切 位 点 ; 8. 剪 切 位 点 ; 9. 起 点 
缺失 ; 10. 移 码 ; 11. ERU UK; 12. 密码 子 插入 ; 13. 密码 子 改变 和 缺失 ;，14. 密码 子 改变 和 插入 ; 15. 同 义 编 


码 区 ; 16. 非 同 义 编码 区 ;17. 同 义 终止 区 ; 18. 终止 区 ; 19. 终止 缺失 ，20. 


l 


他 。 


x 


1. Intergenic; 2. Intragenic; 3. Intron; 4. Upstream; 5. Downstream; 6. Splice site acceptor; 7. Splice site donor; 8. Splice 


site region; 9. Start lost; 10. Frame shift; 11. Condon deletion; 12. Condon insertion; 13. Condon change plus condon 


deletion; 14. Condon change plus condon insertion; 15. Synonymous coding; 16. Non synonymous; 17. Synonymous stop; 


18. Stop gained; 19. Stop lost; 20. Other. 
1 InDel 注释 分 类 
Fig. 1 InDel annotation 


2.2.3 可 变 剪 接 预测 


基因 通过 转录 生成 前 体 mRNA， 再 经 过 不 同 的 剪接 ， 产 生 不 同 的 成 熟 mRNA， 翻 译 为 不 同 的 


BR 


个 样品 中 S mA 3 ? 端 外 显 子 可 变 剪 切 最 多 《图 2)。 


EAM. AH Asprofil (Florea et al., 2013). 软件 对 可 变 剪 接 类 型 和 表达 量 进行 分 析 ， 结 果 表 明 在 9 
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1. EERI 98 890]; 2. 单 内 含 子 滞留 ，3. 多 内 合子 滞留 ，4. 多 外 显 子 跳跃 ; 5. 单 外 显 子 跳跃 ，6. 第 一 个 外 显 


子 可 变 剪 切 ，7. 最 后 一 个 外 显 子 可 变 剪 切 ，8. 可 变 5 或 3? 端 剪 切 〈 模 糊 边界 ) 


; 9. 单 内 含 子 滞留 (模糊 边界 〉; 


10. 多 内 含 子 滞留 〈 模 糊 边界 ) ; 11. 多 外 显 子 跳跃 (模糊 边界 ) ; 12. 单 外 显 子 跳跃 (模糊 边界 〉。 


1. Ae; 2. Ir; 3. Mir; 4. Mskip; 5. Skip; 6. Tss; 7. Tts; 8. Xae; 9. Xir; 10. Xmir; 11. Xmskip; 12. Xskip. 


图 2 可 变 剪 接 事 件数 量 统计 
Fig.2 Alternative Splicing 


2.2.4 基因 结构 优化 


由 于 处 理 数据 的 软件 不 同 或 数据 本 身 的 局 限 性 , 该 文 对 中 国 种 茶树 基因 组 的 261 个 基因 结构 进 


行 了 优化 并 列 出 了 部 分 优化 的 基因 C 4)。 
表 4 优化 的 基因 


Table 4 Gene structure optimized 


基因 ID 基因 座 正 负 “优化 ”原来 注释 的 第 一 个 或 ”优化 后 第 一 个 或 最 
Gene ID Locus 链 位 置 最 后 一 个 外 显 子 起 止 后 一 个 外 显 子 起 止 
Strand Site 坐标 坐标 
Original first or Optimized first or 
termination region termination region 
TEAO04484.1 gene X Scaffold1014:163897-231030 十 5' 205 536-205 536 163 897-205 536 
TEAO000973.1 gene —Scaffold1019:1350887-1371675 十 3' 1 371277-1371 277 1371 277-1371 675 
TEAO016708.1 gene  Scaffold1045:1434954-1455906 十 5' 1 435 240-1 435 240 1 434 954-1 435 240 
TEAO004051.1 gene Scaffold1054:303905-308542 十 3 308 318-308 318 308 318-308 542 
TEAO000171.1 gene Scaffold1058:112241-129629 - 5' 129 534-129 534 129 534-129 629 
TEAO0O07140.1 gene Scaffold1067:122675-156025 - 3' 123 878-123 878 122 675-123 878 
TEAO020092.1 gene X Scaffold1093:635489-640729 十 3' 640 607-640 607 640 607-640 729 
TEAO020094.1 gene Scaffold1093:532337-549457 - 5' 549 397-549 397 549 397-549 457 
TEAO020098.1 gene  Scaffold1093:1162317-1191258 - 3 1 162 515-1 162 515 1 162 317-1 162 515 


202001.00106v1 


chinaXiv 


ChinaXiv& fERBTIJ 


TEAO001055.1 gene  Scaffold1099:848040-870252 - 3 848 142-848 142 848 040-848 142 


2.3 新 基因 


2.3.1 新 基因 功能 注释 

我 们 对 利用 StringTie 拼接 出 来 的 转录 本 与 中 国 种 茶树 基因 组 的 注释 信息 进行 比较 ， 发 掘 出 了 
13 531 个 新 基因 ， 并 将 它们 与 Swiss-Prot COG, Pfam, KEGG, GO 和 NR 数据 库 进 行 BLAST， 获 得 
新 基因 的 注释 信息 〈 表 5). 


表 5 新 基因 功能 注释 结果 


Table 5 Annotation of new genes 


注释 数据 库 新 基因 数目 
Annotated databases New gene number 
COG 2 363 
GO 6218 
KEGG 3 948 
KOG 5 833 
Pfam 5383 
Swiss-Prot 6 900 
eggNOG 9 243 
nr 10 107 
All 10 244 
2.3.2 基因 表达 量 


该 文通 过 最 大 流量 算法 ， 采 用 FPKM (Fragments Per Kilobase of transcript per Million fragments 
mapped) 作为 衡量 基因 表达 量 高 低 的 标准 ，FPKM 计算 公式 如 下 : 
cDNA Fragments 
Mapped Fragments(Millions) x Transcript Length(kb) 
福 易 大 白茶 根 荃 叶 三 个 部 位 的 基因 表达 量 的 密度 分 布 对 比 〈 图 3) 表明 ， 能 够 测序 到 的 编码 蛋白 的 
基因 FPKM 值 跨越 10- 到 10* 六 个 数量 级 。 


FPKM — 


VA BET Teafl 
VA RE2 Leal? 
H3 Leaf? 
2ET Steml 
22 Sem? 
73 Simi 
根 1 Rool 
VA 382 Hoo2 
VA 根 3 Hood 


0 
基因 表达 和 log10(PKM) 


图 3 FPKM 密度 分 布 对 比 
Fig.3 FPKM density 


2.4 差异 表达 分 析 
2.4.1 ZKIA iE 


利用 Deseq CWang et al., 2010) 进行 样品 间 的 差异 表达 分 析 , 并 且 将 Fold Change22, FDR«0.01 
作为 筛选 标准 ， 该 文 列 出 了 部 分 的 差异 表达 基因 并 且 统 计 了 根茎 叶 两 两 样品 间 的 差异 基因 的 数目 


( 表 6， 表 7 


。 从 叶 和 又 ， 


4) 中 可 以 看 出 差异 基因 的 统计 


叶 和 根 ， 茎 和 根 的 差异 表达 火山 图 〈 图 


学 显著 性 以 及 上 调 基 因 和 下 调 基因 ， 红 点 代表 上 调 ， 绿 点 代表 下 调 。 此 外 ,我 们 还 计算 了 三 个 组 织 
差异 表达 基因 的 聚 类 热 图 (图 5)。 


Table 6 Differential expression genes 


表 6 差异 表达 基因 


基因 ID 错误 发 现 率 表达 量 差 异 倍数 对 数值 上 调 或 下 调 
GeneID FDR log2FC Regulated 
TEA000001.1_gene 0.000944095 2.088239721 Up 
TEA000014.1_gene 1.00E-11 -2.156608862 Down 
TEA000018.1_gene 3.88E-39 -4.204470344 Down 
TEA000020.1_gene 4.20E-20 -2.852144505 Down 
TEA000025.1_gene 0.000388739 2.729470094 Up 
TEAO000028.1 gene 1.06E-10 711789907 Up 
TEAO000040.1 gene 3.80E-08 4.115902534 Up 
TEAO000053.1 gene 1.02E-12 -8.291825123 Down 
TEA000057.1. gene 2.37E-12 1.911663895 Up 
WEVSSE Leaf VS Siem 时 VS 视 Leaf VS Root FVS Siem VS Root 
: 
> : i WRRÉR WFO à d $ 
图 4 差异 表达 火山 图 
Fig. 4 Volcano plot 
表 7 差异 表达 基因 数目 
Table 7 DEGs number 
差异 基因 集 差异 基因 数目 上 调 基 因数 目 下 调 基 因数 目 
DEG Set DEG Number Up-regulated Down-regulated 
叶 VS z& Leaf VS Stem 5595 2169 2 826 
IF VS 根 Leaf VS Root 9 650 5056 4 594 
Æ VS 根 Stem VS Root 5 644 2 938 2 706 
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2.4.2 差异 基因 功能 注释 和 富 集 分 析 


hemi 车 2Siem2 33 Sem3 时 1Leafl 叶 2Leaf2 叶 3Leaf3 


1 MC Roo2 483 Roo MHI Leafl M2 Leaf? — 时 3 Leafs 


图 5 25 5t XGA AED RE2S 
Fig.5 Heatmap of DEGs 


AR! Roo 442 Rooi? — 483 Koul3 $I Stem] 382 Stem2 33 Stems 
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对 差异 基因 进行 COG, GO, KEGG, KOG, NR, Pfam, Swiss-Prot 和 eggNOG 功能 注释 CX 8), 2f 
且 绘 制 了 叶 和 茎 、 叶 和 根 、 茎 和 根 差 异 基因 的 GO 功能 分 类 图 (图 6)。 应 用 超 几 何 检验 ， 对 差异 
表达 基因 进行 KEGG 通路 富 集 分 析 ， 统 计 了 显著 性 Q 值 最 小 的 前 20 个 通路 〈 图 7)， 图 中 每 个 圆 
圈 代 表 一 个 pathway 通路 ， 圆 圈 大 小 代表 通路 总 富 集 的 基因 数目 ， 圆 圈 越 大 ， 表 示 基 因 越 多 。 圆 圈 
颜色 代表 q value, q value 越 小 ， 代 表 差 异 基因 在 该 通路 中 的 富 集 性 越 可 靠 ， 所 以 说 该 图 越 靠近 右 
下 角 的 的 圆圈 ， 参 考 价值 越 大 。 
表 8 注释 的 差异 表达 基因 数量 统计 表 
Table 8 Annotation of DEGs in database 


差异 基 注释 到 ”注释 到 注释 到 注释 到 《注释 到 注释 到 注释 到 ”注释 到 注释 到 
因 集 的 所 有 COG 的 GO 的 ”KEGG  KOG 的 NR 的 ”Pfam 的 Swissprot eggNOG 
DEG Set “差异 基 — 差异 基 ” 差异 基 ”的 差异 ”差异 基 差异 其 ”差异 基 的 差异 基 的 差异 
因数 目 因 基因 因 基因 
Total COG GO KEGG KOG NR Pfam Swiss-Prot eggNOG 
HVS% 5 444 2476 3019 1972 2738 5381 4 662 4 520 5337 
Leaf VS 
Stem 
叶 VS 根 9331 4255 4 966 3 357 4 897 9 199 7 900 7 654 9 083 
Leaf VS 
Root 
Z VSR 5454 2 633 2 876 1 899 2768 5 363 4780 4 629 5 298 
Stem VS 


Root 
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EMIF Biological process ERAS) Celular component 分 子 功能 Molocalar funcion 


横 坐 标注 : 1. 代谢 过 程 ，2. 细胞 过 程 ，3. 单 组 织 过 程 ，4. 生物 调节 ; 5. 应 激 反应 ; 6. 定位 ; 7. 细胞 成 分 组 织 或 
生物 合成 ; 8. 发 育 过 程 ; 9. 多 细胞 生物 过 程 ; 10. 信号 ; 11. 生殖 ; 12. 生殖 过 程 ，13. 多 组 织 过 程 ，14. 生长 ; 15. 
解毒 作用 ; 16. 免疫 系统 过 程 ; UT. 生物 附着 ; 18. 生物 相 ; 19. 节律 性 过 程 ; 20. 细胞 杀伤 性 ; 21. 运动 ; 22. 细胞 ; 
23. 细胞 组 件 ; 24. 细胞 器 ; 25. 细胞 膜 ; 26. 细胞 膜 组 件 ; 27. 细胞 器 组 件 ; 28. 大 分 子 复合 物 ; 29. 胞 外 区 ; 30. 细 
胞 膜 内 控 ; 31. 细胞 连接 : 32. 共 质 体 ; 33. 超 分 子 复合 物 ; 34. 拟 核 ，35. 病毒 粒子 ，36. 病毒 粒子 组 件 ;，37. 胞 外 
区 组 件 ，38. 催化 活性 ;39. 结合 40. 转运 活性 ;41. 结构 分 子 活性 ， 42. 核酸 结合 转录 因子 活性 ;43. 电子 载体 
活性 ，44. 信号 转 导 活性 ;45. 分 子 功能 调节 因子 ，46. 抗 氧化 活性 ;，47. 分 子 转 导 活性 ; 48. 营养 库 活 性 ，49. 转 
录 因 子 活性 ， 蛋 白 结 合 ，50. 蛋白 标签 ，51. 金属 伴侣 活性 ，52. 翻译 调控 活性 。 


Abscissa note: 1. Metabolic process; 2. Cellular process; 3. Single-organism process; 4. Biological regulation; 5. Response 


md 


Hl 


to stimulus; 6. Localization; 7. Cellular component organization or biogenesis; 8. Developmental process; 9. Multicellular 
organismal process; 10. Signaling; 11. Reproduction; 12. Reproductive process; 13. Multi-organism process; 14. Growth; 
15. Detoxification; 16. Immune system process; 17. Biological adhesion; 18. Biological phase; 19. Rhythmic process; 20. 
Cell killing; 21. Locomotion; 22. Cell; 23. Cell part; 24. Organelle; 25. Membrane; 26. Membrane part; 27. Organelle part; 
28. Macromolecular; 29. Extracellular region; 30. Membrane-enclosed lumen; 31. Cell junction; 32. Symplast; 33. 
Supramolecular complex; 34. Nucleoid; 35. Virion; 36. Virion part; 37. Extracellular region part; 38. Catalytic activity; 39. 
Binding; 40. Transporter activity; 41. Structural molecule activity; 42. Nucleic acid binding transcription factor activity; 43. 


Electron carrier activity; 44. Signal transducer activity; 45. Molecular function regulator; 46. Antioxidant activity; 47. 


Molecular transducer activity; 48. Nutrient reservoir activity; 49. Transcription factor activity, protein binding; 50. Protein 
tag; 51. Metallochaperone activity; 52. Translation regulator activity. 

图 6 差异 表达 基因 GO 注释 分 类 

Fig.6 GO functional classification 
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纵 坐 标注 : 1. 有 机 含 硒 化 合 物 代 谢 ，2. 类 胡萝卜 素 生 物 合成 ， 3. 类 黄酮 生物 合成 ; 4. 糖尿 病 并 发 症 中 的 年 龄 信号 
通路 ，5. 淀粉 和 蔗糖 代谢 ，6.、 碳 代谢 ，7， 叶酸 碳 池 ，8， 半 乳糖 代谢 ，9、 角质 、 亚 氨 酸 和 里 的 生物 合成 ，10. Aus 


类 生物 合成 ，11. 甘氨酸 、 丝 氨 酸 和 苏 氨 酸 代谢 ，12. 光合 生物 固 碳 作 用 ;13. 乙 醛 酸 和 二 羧 酸 代谢 ，14. E 

15. 氰 基 和 氨基 酸 代谢 ，16. 植物 激素 信号 转 导 ; 17. 中 啉 和 叶绿素 代谢 ; 18. 茶 丙 素 的 生物 合成 ，19. 光合 作用 -天 线 

和 蛋白; 20. 光合 作用 ; 21. 抗坏血酸 和 醋酸 代谢 ，22. 硫 代谢 ，23. 双 柄 和 其 它 熙 烯 醒 生 物 合成 ; 24. 谷 胱 甘 肽 代谢 ; 

25. 熙 类 骨架 生物 合成 ,26. 磷酸 成 糖 途径 ，27. 脂肪 酸 降 解 ， 28. 糖 酵 解 / 糖 新 生 ; 29. 亚麻 酸 代谢 ，30. ZEW 
合成 ; 31. 倍 半 着 和 三 萌生 物 合成 。 


Ordinate note: 1. Selenocompound metabolism; 2. Carotenoid biosynthesis; 3. Flavonoid biosynthesis; 4. AGE-RAGE 
signalling pathway in diabetic complications; 5. Starch and sucrose metabolism; 6. Carbon metabolism; 7. One carbon pool 
by folate; 8. Galactose metabolism; 9. Cutin, suberine and wax biosynthesis; 10. Monoterpenoid biosynthesis; 11. Glycine, 

serine and threonine metabolism; 12. Carbon fixation in photosynthetic organism; 13. Glyoxylate and dicarboxylate 

metabolism; 14. Nitrogen metabolism; 15. Cyanoamino acid metabolism; 16. Plant hormone signal transduction; 17. 

Porphyrin and chlorophyll metabolism; 18. Phenylpropanoid biosynthesis; 19. Photosynthesis-antenna proteins; 20. 
Photosynthesis; 21. Ascorbate and aldarate metabolism; 22. Sulfur metabolism; 23. Biquinone and other terpenoid-quinone 
biosynthesis; 24. Glutathione metabolism; 25. Terpenoid backbone biosynthesis; 26. Pentose phosphate pathway; 27. Fatty 
acid degradation; 28. Glycolysis/Gluconeogenesis; 29. Alpha-Linolenic acid metabolism; 30. Diterpenoid biosynthesis; 31. 


Sesquiterpenoid and triterpenoid biosynthesis. 


图 7 差异 表达 基因 KEGG 通路 寅 及 
Fig. 7 KEGG pathway enrichment 


Mt 


2.5 DEU 分 析 


该 文 应 用 DEXSeq (Anders et al., 2012) 进行 外 显 子 水 平 的 差异 分 析 , BI DEU (differential exon 
usage) 分 析 ， 设 置 FDR<0.01， 该 文 列 出 了 叶 和 茎 的 部 分 DEU C& 9). 


表 9 差异 外 显 子 表达 分 析 


Table 9 Differential exon expression 


kE DX] ID 外 显 子 ID 表达 量 差异 倍数 P 错误 发 现 率 
Gene ID Exon ID log2(FC) P value FDR 

TEAO018663.1 gene E010 0.403936012 1.04E-07 2.12E-05 
TEA018663.1 gene E011 -1.732604999 6.69E-25 9.75E-22 
TEAO018662.1 gene E001 -0.96779822 5.47E-05 0.00551022 
TEA012997.1 gene E007 -0.308323557 1.95E-10 6.24E-08 
TEAO021927.1. gene E001 0.168112449 1.33E-08 3.25E-06 
TEAO016026.1. gene E002 -1.273705747 ].32E-05 0.001577751 
TEAO031666.1 gene E001 0.032790485 1.98E-06 0.000300559 
TEA031666.1 gene E002 -0.077595321 2.13E-06 0.000320651 
TEAO016705.1. gene E001 -0.600866652 1.58E-07 3.06E-05 
3 讨论 


福 易 大 白 种 茶树 是 异 花 授 粉 的 经 济 作物 ， 基 因 组 杂 合 度 高 ， 具 有 优良 的 发 芽 率 、 抗 寒 性 和 耐 旱 
性 〈 刘 本 英 等 ，2008)。 本 研究 对 都 匀 地 区 福 易 大 白 种 根茎 叶 进 行 了 转录 组 测序 ，Q30 碱 基 百 分 比 
不 小 于 93.22%， 样 品 与 参考 基因 组 的 比 对 效率 在 87.83%~91.14% 之 间 。 而 李 明 簿 等 (2018〉 对 吏 
安 白茶 芽 和 叶 的 转录 组 研究 中 ，Q30 值 都 为 87.3296, Liu et al. 2017) 对 瑞雪 的 转录 组 研究 中 ，Q20 


为 97% 左 右 ，Wei et al. (2018) 


文库 构建 成 功 且 测序 质量 良好 ， 可 进行 下 一 步 分 析 。SNP 位 点 数目 从 489 642-638 706， 转 换 类 型 


对 龙井 43 的 转录 组 研究 中 ，Q30 为 90% 左 右 ， 因 此 ， 福 而 大 白 种 


比例 从 65.4696-66.3390,, Hyd 27 JA, 33.6796-34.5496, WAA! SNP 位 点 比例 从 34.70%~51.38%。 
对 261 个 基因 进行 了 结构 优化 ， 发 现 了 13 531 个 新 基因 ， 其 中 10 244 个 新 基因 被 注释 了 ， 注 释 到 
COG 数据 库 中 有 2 363 个 ， 注 释 到 GO 的 有 6 218 个 ， 注 释 到 KEGG 的 有 3 948 个 ， 注 释 到 KOG 


的 有 5 833 个 ， 注 释 到 Pfam 的 有 5 383 个 ， 注 释 到 SwissProt 的 有 6 900 个 ， 注 释 到 eggNOG 的 有 


9 243 个 ， 注 释 到 nr 的 有 10 107 


Aa 


di X EUR ZEE HUS 12595 个 基因 参与 代谢 过 程 ， 12 507 个 基因 参与 催化 活性 ， 8176 个 


基因 参与 细胞 组 成 成 分 ， 是 基因 数 最 多 的 三 个 生物 过 程 。 陈 琳 波 等 《2015) 对 “ 紫 鹏 ”条 树 的 转录 组 


分 析 中 ，Unigene 的 GO 分 析 表 明 ， 代 谢 过 程 、 细 胞 、 细 胞 部 分 、 催 化 活性 等 富 集 程 度 较 高 ， 与 本 


研究 结果 相 一 致 。 三 个 组 织 中 有 


1615 个 基因 参与 发 育 过 程 (278，405，191)， 即 时 和 荟 参 与 此 过 


程 的 有 278 个 差异 基因 ， 叶 和 根 中 有 405 ARREA, ZARRA 191 个 。 根 葵 叶 有 1 401 个 基因 
参与 运输 活动 (197, 356, 231), 288 个 基因 参与 生长 过 程 (47, 65, 20), 262 个 基因 参与 信号 转 


都 色 地 区 茶 独 特 的 风味 是 由 


导 活 动 (44, 70, 300, 200 个 基因 参与 免疫 反应 过 程 (35, 56, 36). 


叶片 中 的 茶 氨 酸 、 兹 烯 类 和 类 黄酮 的 代谢 产物 赋予 的 。Wu et al. 


(2013) 从 茶树 叶片 的 转录 组 研究 中 得 出 大 多 数 基因 参与 编码 合成 黄酮 类 、 咖 啡 碱 和 茶 氨 酸 等 次 生 
代谢 途径 的 重要 酶 。 该 文通 过 KEGG 功能 显著 性 富 集 分 析 ， 发 现 叶 和 茎 、 叶 和 根 、 茎 和 根 差异 基 
因 参 与 的 部 分 极其 显著 的 通路 有 类 胡萝卜 素 生物 合成 , 泛 柄 和 其 他 熙 烯 类 醒 的 生物 合成 ,单间 生物 
合成 ， 甘 氮 酸 、 丝 氨 酸 和 苏 氨 酸 代谢 ， 乙 醛 酸 和 二 凑 酸 代谢 ， 植 物 激素 信号 转 导 ， 中 啉 和 叶绿素 代 


谢 , 茶 丙 素 的 生物 合成 , 光合 作 上 月 


日 天 线 蛋 白 和 光合 作用 ,类 黄酮 生物 合成 , REOS HET ER 


亚麻 酸 代 谢 等 显著 富 集 。 叶 和 茎 的 差异 表达 基因 在 KEGG 通路 中 , 有 90 个 基因 参与 碳 代谢 (8.65%， 


21，69)， 占 所 有 差异 基因 的 8.6595, KPA 21 个 差异 基因 在 茎 中 表达 上 调 ，69 个 差异 基因 在 叶 中 
表达 上 调 。79 个 差异 基因 参与 植物 激素 信号 转 寻 CI.696, 55, 24), 75 个 差异 基因 参与 茶 丙 素 的 生 
物 合 成 〈7.21%，49，26)，70 个 差异 基因 参与 淀粉 和 芒 糖 代谢 〈6.73%，46，24, )， 64 个 差异 基 
因 参 与 氨基 酸 生 物 合 成 (6.15%，22，42)，43 个 差异 基因 参与 植物 病原 体 互 作 通 路 (4.1390, 30, 
13), 19 差异 基因 参与 类 黄酮 的 生物 合成 (1.83%, 13, 6), 20 个 差异 基因 参与 匡 类 化 合 物 生物 合 
成 (1.92%，4，16)，24 个 差异 基因 参与 中 啉 和 叶绿素 代谢 (2.3196, 1, 23), 44 个 差异 基因 参与 
光合 作用 〈4.23%，0，44)。 以 上 研究 表明 都 匀 地 区 福 易 大 白茶 独特 的 香味 和 各 种 健康 功能 主要 归 
因 于 熙 类 物质 合成 光合 作用、 类 黄酮 的 生物 合成 等 生物 过 程 ， 类 黄酮 主要 赋予 茶 的 苦味 ， 二 相 类 
化 合 物 的 水 解 产物 具有 令 人 愉悦 的 香味 和 特色 风味 。 为 进一步 研究 都 匀 地 区 福 易 大 白茶 生长 发 育 和 
遗传 育种 提供 了 分 子 基 础 ， 并 为 揭示 与 类 黄酮 相关 代谢 通路 有 关 基 因 提 供 了 重要 理论 依据 。 
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